Đây là gói dữ liệu khảo sát hơn 20000 hộ dân thành phố HCMC. Dữ liệu được khảo sát trong giai đoạn lập dự án khả thi xây dựng hệ thống Metro cho thành phố hồ chí minh.
Xem phần đầu của dữ liệu
library(readxl)# gói phụ kiện để đọc dữ liệu từ bảng tính excel
library(DT)
df=data.frame(read_excel("dieutra-hogiadinh-hcm.xlsx",sheet="ketquadieutra",skip = 0)) #
p<-datatable(head(df),rownames = FALSE,extensions = c('FixedColumns'),
options = list(pageLength = 10,
columnDefs = list(list(className = 'dt-left'))
,autoWidth = TRUE,scrollX = TRUE,fixedColumns = TRUE)
)
p
Xem phần đuôi của dữ liệu
datatable(tail(df),rownames = FALSE,extensions = c('FixedColumns'),
options = list(pageLength = 10,
columnDefs = list(list(className = 'dt-left'))
,autoWidth = TRUE,scrollX = TRUE,fixedColumns = TRUE)
)
Xem cấu trúc của dữ liệu
str(head(df))
## 'data.frame': 6 obs. of 229 variables:
## $ X1 : chr "Q1a" "1" "2" "3" ...
## $ X2 : chr "Q1b" "34" "34" "369" ...
## $ X3 : chr "Q1c" "47" "94" "801" ...
## $ X4 : chr "Q1d" "47" "94" "801" ...
## $ X5 : chr "Q1e" "29" "29" "367" ...
## $ X6 : chr "Q1f1" "13" "13" "17" ...
## $ X7 : chr "Q1f2" "1" "1" "2" ...
## $ X8 : chr "Q1g1" "10" "10" "15" ...
## $ X9 : chr "Q1g2" "1" "1" "2" ...
## $ X10 : chr "Q2" "2" "2" "2" ...
## $ X11 : chr "Q3" "B<U+1EA1>ch Minh H<U+1EA3>i" "Ðào Ð<U+1EE9>c Hoàng" "nguy<U+1EC5>n van t<U+1ED1>t" ...
## $ X12 : chr "Q4" "202" "202" "67" ...
## $ X13 : chr "Q5" "1" "1" "1" ...
## $ X14 : chr "Q6a" "1" "1" "1" ...
## $ X15 : chr "Q6b" "1674385916" "837222457" "838597075" ...
## $ X16 : chr "Q7" "1" "1" "1" ...
## $ X17 : chr "Q8a" "1" "2" "1" ...
## $ X18 : chr "Q8b" "2" "3" "3" ...
## $ X19 : chr "Q8c" "2" "2" "1" ...
## $ X20 : chr "Q8d" "2" "2" "1" ...
## $ X21 : chr "Q8e" "3" "3" "1" ...
## $ X22 : chr "Q9" NA "2500000" NA ...
## $ X23 : chr "Q10" "25" "7" "62" ...
## $ X24 : chr "Q11" "202" "298" NA ...
## $ X25 : chr "Q12a" "1" "1" "1" ...
## $ X26 : chr "Q12b" "1" "1" "1" ...
## $ X27 : chr "Q12c" "2" "2" "2" ...
## $ X28 : chr "Q12d" "1" "1" "2" ...
## $ X29 : chr "Q12e" "2" "1" "1" ...
## $ X30 : chr "Q12f" "2" "1" "1" ...
## $ X31 : chr "Q13a" "3" "4" "3" ...
## $ X32 : chr "Q13b" "0" "0" "0" ...
## $ X33 : chr "Q13c" "0" "0" "0" ...
## $ X34 : chr "Q13d" "0" "0" "0" ...
## $ X35 : chr "Q13e" "0" "0" "0" ...
## $ X36 : chr "Q13f" "0" "0" "1" ...
## $ X37 : chr "Q13g" "0" "0" "0" ...
## $ X38 : chr "Q13h" "0" "0" "0" ...
## $ X39 : chr "Q13i" "0" "0" "0" ...
## $ X40 : chr "Q13j" "0" "0" "0" ...
## $ X41 : chr "Q13k" "3" "4" "3" ...
## $ X42 : chr "Q13l" "3" "3" "3" ...
## $ X43 : chr "Q13m" "0" "0" "0" ...
## $ X44 : chr "Q14" "9" "10" "9" ...
## $ X45 : chr "Q15" "2" "3" "3" ...
## $ X46 : chr "Q16" "1" "2" "1" ...
## $ X47 : chr "Q17" "1" "1" "1" ...
## $ X48 : chr "Q18a1" "6" "6" "6" ...
## $ X49 : chr "Q18b1" "5" "10" "3" ...
## $ X50 : chr "Q18c1" "1" "1" "1" ...
## $ X51 : chr "Q18d1" "1" "1" "1" ...
## $ X52 : chr "Q18a2" "1" "6" "6" ...
## $ X53 : chr "Q18b2" "2" "10" "2" ...
## $ X54 : chr "Q18c2" "1" "1" "1" ...
## $ X55 : chr "Q18d2" "2" "1" "1" ...
## $ X56 : chr "Q18a3" NA "8" NA ...
## $ X57 : chr "Q18b3" NA "10" NA ...
## $ X58 : chr "Q18c3" NA "1" NA ...
## $ X59 : chr "Q18d3" NA "1" NA ...
## $ X60 : chr "Q18a4" NA NA NA ...
## $ X61 : chr "Q18b4" NA NA NA ...
## $ X62 : chr "Q18c4" NA NA NA ...
## $ X63 : chr "Q18d4" NA NA NA ...
## $ X64 : chr "Q18a5" NA NA NA ...
## $ X65 : chr "Q18b5" NA NA NA ...
## $ X66 : chr "Q18c5" NA NA NA ...
## $ X67 : chr "Q18d5" NA NA NA ...
## $ X68 : chr "Q18a6" NA NA NA ...
## $ X69 : chr "Q18b6" NA NA NA ...
## $ X70 : chr "Q18c6" NA NA NA ...
## $ X71 : chr "Q18d6" NA NA NA ...
## $ X72 : chr "Q18a7" NA NA NA ...
## $ X73 : chr "Q18b7" NA NA NA ...
## $ X74 : chr "Q18c7" NA NA NA ...
## $ X75 : chr "Q18d7" NA NA NA ...
## $ X76 : chr "Q18a8" NA NA NA ...
## $ X77 : chr "Q18b8" NA NA NA ...
## $ X78 : chr "Q18c8" NA NA NA ...
## $ X79 : chr "Q18d8" NA NA NA ...
## $ X80 : chr "Q18a9" NA NA NA ...
## $ X81 : chr "Q18b9" NA NA NA ...
## $ X82 : chr "Q18c9" NA NA NA ...
## $ X83 : chr "Q18d9" NA NA NA ...
## $ X84 : chr "Q18a10" NA NA NA ...
## $ X85 : chr "Q18b10" NA NA NA ...
## $ X86 : chr "Q18c10" NA NA NA ...
## $ X87 : chr "Q18d10" NA NA NA ...
## $ X88 : chr "Q19" "300000" "1000000" "900000" ...
## $ X89 : chr "Q43" "5" "2" "5" ...
## $ X90 : chr "Q44a" "2" "2" "1" ...
## $ X91 : chr "Q44b" "202" "298" NA ...
## $ X92 : chr "Q45" "1" "1" "1" ...
## $ X93 : chr "Q46" "5" "2" "5" ...
## $ X94 : chr "Q53" "2" "1" "2" ...
## $ X95 : chr "Q54" "2" "2" "2" ...
## $ X96 : chr "Q55" NA "1" NA ...
## $ X97 : chr "Q56" NA "3" NA ...
## $ X98 : chr "Q57" NA "3" NA ...
## $ X99 : chr "Q58" NA "3" NA ...
## [list output truncated]
library(dplyr)
glimpse(head(df))
## Rows: 6
## Columns: 229
## $ X1 <chr> "Q1a", "1", "2", "3", "4", "5"
## $ X2 <chr> "Q1b", "34", "34", "369", "377", "371"
## $ X3 <chr> "Q1c", "47", "94", "801", "801", "801"
## $ X4 <chr> "Q1d", "47", "94", "801", "801", "801"
## $ X5 <chr> "Q1e", "29", "29", "367", "367", "367"
## $ X6 <chr> "Q1f1", "13", "13", "17", "25", "26"
## $ X7 <chr> "Q1f2", "1", "1", "2", "2", "2"
## $ X8 <chr> "Q1g1", "10", "10", "15", "24", "25"
## $ X9 <chr> "Q1g2", "1", "1", "2", "2", "2"
## $ X10 <chr> "Q2", "2", "2", "2", "2", "2"
## $ X11 <chr> "Q3", "B<U+1EA1>ch Minh H<U+1EA3>i", "Ðào Ð<U+1EE9>c Hoàng", "nguy<U+1EC5>n van t<U+1ED1>t", "lê min~
## $ X12 <chr> "Q4", "202", "202", "67", "67", "67"
## $ X13 <chr> "Q5", "1", "1", "1", "1", "1"
## $ X14 <chr> "Q6a", "1", "1", "1", "1", "1"
## $ X15 <chr> "Q6b", "1674385916", "837222457", "838597075", "908739072", "9370~
## $ X16 <chr> "Q7", "1", "1", "1", "1", "1"
## $ X17 <chr> "Q8a", "1", "2", "1", "1", "2"
## $ X18 <chr> "Q8b", "2", "3", "3", "2", "2"
## $ X19 <chr> "Q8c", "2", "2", "1", "1", "1"
## $ X20 <chr> "Q8d", "2", "2", "1", "2", "2"
## $ X21 <chr> "Q8e", "3", "3", "1", "1", "1"
## $ X22 <chr> "Q9", NA, "2500000", NA, NA, "1800000"
## $ X23 <chr> "Q10", "25", "7", "62", "75", "1"
## $ X24 <chr> "Q11", "202", "298", NA, NA, "73"
## $ X25 <chr> "Q12a", "1", "1", "1", "1", "1"
## $ X26 <chr> "Q12b", "1", "1", "1", "1", "1"
## $ X27 <chr> "Q12c", "2", "2", "2", "2", "1"
## $ X28 <chr> "Q12d", "1", "1", "2", "1", "2"
## $ X29 <chr> "Q12e", "2", "1", "1", "2", "2"
## $ X30 <chr> "Q12f", "2", "1", "1", "2", "1"
## $ X31 <chr> "Q13a", "3", "4", "3", "4", "4"
## $ X32 <chr> "Q13b", "0", "0", "0", "0", "0"
## $ X33 <chr> "Q13c", "0", "0", "0", "0", "0"
## $ X34 <chr> "Q13d", "0", "0", "0", "0", "0"
## $ X35 <chr> "Q13e", "0", "0", "0", "0", "0"
## $ X36 <chr> "Q13f", "0", "0", "1", "0", "0"
## $ X37 <chr> "Q13g", "0", "0", "0", "0", "0"
## $ X38 <chr> "Q13h", "0", "0", "0", "0", "0"
## $ X39 <chr> "Q13i", "0", "0", "0", "0", "0"
## $ X40 <chr> "Q13j", "0", "0", "0", "0", "0"
## $ X41 <chr> "Q13k", "3", "4", "3", "4", "4"
## $ X42 <chr> "Q13l", "3", "3", "3", "4", "4"
## $ X43 <chr> "Q13m", "0", "0", "0", "0", "0"
## $ X44 <chr> "Q14", "9", "10", "9", "11", "8"
## $ X45 <chr> "Q15", "2", "3", "3", "2", "3"
## $ X46 <chr> "Q16", "1", "2", "1", "1", "2"
## $ X47 <chr> "Q17", "1", "1", "1", "1", "1"
## $ X48 <chr> "Q18a1", "6", "6", "6", "6", "6"
## $ X49 <chr> "Q18b1", "5", "10", "3", "6", "3"
## $ X50 <chr> "Q18c1", "1", "1", "1", "1", "1"
## $ X51 <chr> "Q18d1", "1", "1", "1", "1", "1"
## $ X52 <chr> "Q18a2", "1", "6", "6", "6", "6"
## $ X53 <chr> "Q18b2", "2", "10", "2", "5", "2"
## $ X54 <chr> "Q18c2", "1", "1", "1", "1", "1"
## $ X55 <chr> "Q18d2", "2", "1", "1", "1", "1"
## $ X56 <chr> "Q18a3", NA, "8", NA, "6", "6"
## $ X57 <chr> "Q18b3", NA, "10", NA, "2", "2"
## $ X58 <chr> "Q18c3", NA, "1", NA, "1", "1"
## $ X59 <chr> "Q18d3", NA, "1", NA, "1", "1"
## $ X60 <chr> "Q18a4", NA, NA, NA, NA, "1"
## $ X61 <chr> "Q18b4", NA, NA, NA, NA, "1"
## $ X62 <chr> "Q18c4", NA, NA, NA, NA, "1"
## $ X63 <chr> "Q18d4", NA, NA, NA, NA, "2"
## $ X64 <chr> "Q18a5", NA, NA, NA, NA, NA
## $ X65 <chr> "Q18b5", NA, NA, NA, NA, NA
## $ X66 <chr> "Q18c5", NA, NA, NA, NA, NA
## $ X67 <chr> "Q18d5", NA, NA, NA, NA, NA
## $ X68 <chr> "Q18a6", NA, NA, NA, NA, NA
## $ X69 <chr> "Q18b6", NA, NA, NA, NA, NA
## $ X70 <chr> "Q18c6", NA, NA, NA, NA, NA
## $ X71 <chr> "Q18d6", NA, NA, NA, NA, NA
## $ X72 <chr> "Q18a7", NA, NA, NA, NA, NA
## $ X73 <chr> "Q18b7", NA, NA, NA, NA, NA
## $ X74 <chr> "Q18c7", NA, NA, NA, NA, NA
## $ X75 <chr> "Q18d7", NA, NA, NA, NA, NA
## $ X76 <chr> "Q18a8", NA, NA, NA, NA, NA
## $ X77 <chr> "Q18b8", NA, NA, NA, NA, NA
## $ X78 <chr> "Q18c8", NA, NA, NA, NA, NA
## $ X79 <chr> "Q18d8", NA, NA, NA, NA, NA
## $ X80 <chr> "Q18a9", NA, NA, NA, NA, NA
## $ X81 <chr> "Q18b9", NA, NA, NA, NA, NA
## $ X82 <chr> "Q18c9", NA, NA, NA, NA, NA
## $ X83 <chr> "Q18d9", NA, NA, NA, NA, NA
## $ X84 <chr> "Q18a10", NA, NA, NA, NA, NA
## $ X85 <chr> "Q18b10", NA, NA, NA, NA, NA
## $ X86 <chr> "Q18c10", NA, NA, NA, NA, NA
## $ X87 <chr> "Q18d10", NA, NA, NA, NA, NA
## $ X88 <chr> "Q19", "300000", "1000000", "900000", "1800000", "1200000"
## $ X89 <chr> "Q43", "5", "2", "5", "5", "1"
## $ X90 <chr> "Q44a", "2", "2", "1", "1", "2"
## $ X91 <chr> "Q44b", "202", "298", NA, NA, "73"
## $ X92 <chr> "Q45", "1", "1", "1", "6", "5"
## $ X93 <chr> "Q46", "5", "2", "5", "3", "5"
## $ X94 <chr> "Q53", "2", "1", "2", "2", "1"
## $ X95 <chr> "Q54", "2", "2", "2", "2", "2"
## $ X96 <chr> "Q55", NA, "1", NA, NA, "2"
## $ X97 <chr> "Q56", NA, "3", NA, NA, "3"
## $ X98 <chr> "Q57", NA, "3", NA, NA, "2"
## $ X99 <chr> "Q58", NA, "3", NA, NA, "2"
## $ X100 <chr> "Q59", NA, "2", NA, NA, "2"
## $ X101 <chr> "Q60", NA, "1", NA, NA, "1"
## $ X102 <chr> "Q61", "1", "3", "2", "2", "2"
## $ X103 <chr> "Q62a1", "3", "2", "3", "3", "3"
## $ X104 <chr> "Q62a2", "2", "2", "2", "2", "2"
## $ X105 <chr> "Q62a3", "3", "3", "3", "3", "2"
## $ X106 <chr> "Q62a4", "2", "1", "2", "2", "3"
## $ X107 <chr> "Q62a5", "1", "2", "2", "2", "2"
## $ X108 <chr> "Q62b1", "2", "1", "2", "2", "2"
## $ X109 <chr> "Q62b2", "2", "1", "3", "1", "1"
## $ X110 <chr> "Q62b3", "2", "2", "2", "1", "2"
## $ X111 <chr> "Q62b4", "2", "2", "2", "2", "1"
## $ X112 <chr> "Q62b5", "2", "2", "3", "2", "1"
## $ X113 <chr> "Q62c", "3", "1", "4", "3", "3"
## $ X114 <chr> "Q63a1", "3", "3", "1", "2", "3"
## $ X115 <chr> "Q63b1", "2", "3", "1", "3", "2"
## $ X116 <chr> "Q63c1", "2", "2", "2", "3", "3"
## $ X117 <chr> "Q63a2", "2", "2", "2", "3", "3"
## $ X118 <chr> "Q63b2", "2", "3", "2", "2", "3"
## $ X119 <chr> "Q63c2", "2", "3", "2", "3", "2"
## $ X120 <chr> "Q63a3", "3", "3", "1", "1", "2"
## $ X121 <chr> "Q63b3", "2", "3", "2", "2", "1"
## $ X122 <chr> "Q63c3", "2", "3", "2", "2", "2"
## $ X123 <chr> "Q63a4", "3", "3", "1", "2", "2"
## $ X124 <chr> "Q63b4", "2", "3", "2", "1", "2"
## $ X125 <chr> "Q63c4", "2", "3", "2", "2", "1"
## $ X126 <chr> "Q64", "5", "3", "4", "4", "4"
## $ X127 <chr> "Q65", "3", NA, NA, NA, NA
## $ X128 <chr> "Q66_1", "3", "3", "3", "4", "5"
## $ X129 <chr> "Q66_2", "2", "3", "3", "4", "4"
## $ X130 <chr> "Q66_3", "2", "4", "6", "4", "3"
## $ X131 <chr> "Q66_4", "2", "2", "6", "2", "3"
## $ X132 <chr> "Q66_5", "3", "3", "2", "2", "4"
## $ X133 <chr> "Q66_6", "3", "3", "6", "2", "5"
## $ X134 <chr> "Q66_7", "2", "2", "2", "2", "5"
## $ X135 <chr> "Q66_8", "3", "2", "6", "3", "5"
## $ X136 <chr> "Q66_9", "3", "3", "2", "3", "2"
## $ X137 <chr> "Q66_10", "3", "3", "3", "5", "2"
## $ X138 <chr> "Q66_11", "3", "4", "3", "6", "3"
## $ X139 <chr> "Q66_12", "4", "4", "6", "6", "3"
## $ X140 <chr> "Q66_13", "2", "2", "6", "6", "3"
## $ X141 <chr> "Q66a", "1", "13", "1", "1", "4"
## $ X142 <chr> "Q66b", "2", "8", "2", "4", "7"
## $ X143 <chr> "Q66c", "4", "4", "7", "6", "9"
## $ X144 <chr> "Q67a_1", "2", "1", "1", "1", "2"
## $ X145 <chr> "Q67a_2", "6", "3", "2", "8", "8"
## $ X146 <chr> "Q67a_3", "5", "7", "6", "5", "4"
## $ X147 <chr> "Q67b_1", "4", "4", "4", "7", "6"
## $ X148 <chr> "Q67b_2", "1", "5", "5", "6", "1"
## $ X149 <chr> "Q67b_3", "7", "6", "7", "3", "7"
## $ X150 <chr> "Q67c_1", "4", "7", "4", "4", "7"
## $ X151 <chr> "Q67c_2", "8", "2", "5", "5", "3"
## $ X152 <chr> "Q67c_3", "6", "5", "7", "2", "2"
## $ X153 <chr> "Q68a_1", "1", "3", "11", "2", "1"
## $ X154 <chr> "Q68a_2", "3", "2", "12", "10", "9"
## $ X155 <chr> "Q68a_3", "5", "5", "8", "5", "5"
## $ X156 <chr> "Q68a_4", "6", "1", "5", "1", "10"
## $ X157 <chr> "Q68a_5", "11", "10", "16", "8", "11"
## $ X158 <chr> "Q68b_1", "13", "7", "7", "13", "8"
## $ X159 <chr> "Q68b_2", "14", "8", "9", "4", "2"
## $ X160 <chr> "Q68b_3", "15", "9", "4", "9", "12"
## $ X161 <chr> "Q68b_4", "16", "16", "13", "7", "3"
## $ X162 <chr> "Q68b_5", "4", "12", "14", "3", "7"
## $ X163 <chr> "Q68c_1", "8", "5", "7", "16", "4"
## $ X164 <chr> "Q68c_2", "9", "9", "13", "6", "13"
## $ X165 <chr> "Q68c_3", "7", "13", "14", "12", "6"
## $ X166 <chr> "Q68c_4", "13", "6", "4", "15", "14"
## $ X167 <chr> "Q68c_5", "16", "15", "3", "8", "7"
## $ X168 <chr> "Q69a_1", "3", "4", "3", "5", "5"
## $ X169 <chr> "Q69a_2", "2", "2", "3", "3", "4"
## $ X170 <chr> "Q69a_3", "2", "2", "2", "3", "3"
## $ X171 <chr> "Q69a_4", "4", "3", "3", "2", "3"
## $ X172 <chr> "Q69a_5", "3", "3", "4", "3", "3"
## $ X173 <chr> "Q69a_6", "2", "4", "3", "6", "5"
## $ X174 <chr> "Q69a_7", "2", "4", "3", "5", "5"
## $ X175 <chr> "Q69a_8", "1", "1", "4", "5", "5"
## $ X176 <chr> "Q69a_9", "1", "1", "2", "5", "4"
## $ X177 <chr> "Q69a_10", "2", "1", "3", "4", "4"
## $ X178 <chr> "Q69b_1", "3", "8", "2", "2", "3"
## $ X179 <chr> "Q69b_2", "8", "9", "8", "6", "5"
## $ X180 <chr> "Q69b_3", "9", "3", "10", "8", "8"
## $ X181 <chr> "Q70", "2", "2", "2", "1", "1"
## $ X182 <chr> "Q71a_1", "1", "1", "1", "1", "1"
## $ X183 <chr> "Q71a_2", "1", "1", "1", "1", "2"
## $ X184 <chr> "Q71a_3", "2", "2", "1", "1", "2"
## $ X185 <chr> "Q71a_4", "1", "2", "2", "2", "2"
## $ X186 <chr> "Q71a_5", "1", "2", "1", "2", "1"
## $ X187 <chr> "Q71a_6", "1", "1", "1", "2", "1"
## $ X188 <chr> "Q71a_7", "1", "1", "2", "3", "2"
## $ X189 <chr> "Q71a_8", "1", "1", "1", "3", "1"
## $ X190 <chr> "Q71a_9", "1", "1", "1", "3", "3"
## $ X191 <chr> "Q71a_10", "1", "3", "1", "2", "1"
## $ X192 <chr> "Q71a_11", "1", "3", "1", "2", "1"
## $ X193 <chr> "Q71a_12", "1", "3", "2", "2", "3"
## $ X194 <chr> "Q71a_13", "2", "3", "2", "1", "2"
## $ X195 <chr> "Q71a_14", "1", "1", "2", "1", "1"
## $ X196 <chr> "Q71a_15", "1", "1", "1", "1", "1"
## $ X197 <chr> "Q71a_16", "1", "1", "2", "2", "2"
## $ X198 <chr> "Q71a_17", "1", "1", "1", "2", "3"
## $ X199 <chr> "Q71a_18", "1", "2", "1", "2", "3"
## $ X200 <chr> "Q71b_1", "2", "8", "1", "1", "3"
## $ X201 <chr> "Q71b_2", "15", "7", "6", "2", "8"
## $ X202 <chr> "Q72", "1", "1", "1", "2", "2"
## $ X203 <chr> "Q73a", "2", "3", "1", "6", "6"
## $ X204 <chr> "Q73b", "3", "4", "2", "5", "5"
## $ X205 <chr> "Q73c", "1", "1", "5", "7", "2"
## $ X206 <chr> "Q73d", "6", "2", "3", "2", "1"
## $ X207 <chr> "Q73e", "4", "7", "4", "1", "7"
## $ X208 <chr> "Q73f", "5", "6", "6", "3", "3"
## $ X209 <chr> "Q73g", "7", "5", "7", "4", "4"
## $ X210 <chr> "A74a_1", "4", "5", "3", "5", "5"
## $ X211 <chr> "A74a_2", "5", "5", "3", "6", "5"
## $ X212 <chr> "A74a_3", "5", "5", "4", "3", "3"
## $ X213 <chr> "A74a_4", "5", "5", "3", "2", "3"
## $ X214 <chr> "A74a_5", "5", "5", "2", "2", "4"
## $ X215 <chr> "A74a_6", "5", "5", "3", "4", "5"
## $ X216 <chr> "A74a_7", "5", "5", "3", "5", "4"
## $ X217 <chr> "A74a_8", "5", "5", "4", "4", "3"
## $ X218 <chr> "A74a_9", "5", "5", "4", "4", "5"
## $ X219 <chr> "A74a_10", "5", "5", "3", "4", "5"
## $ X220 <chr> "A74a_11", "5", "5", "3", "3", "3"
## $ X221 <chr> "A74a_12", "5", "5", "2", "3", "3"
## $ X222 <chr> "A74a_13", "5", "5", "3", "3", "4"
## $ X223 <chr> "A74a_14", "3", "4", "3", "4", "6"
## $ X224 <chr> "A74a_15", "3", "4", "3", "4", "4"
## $ X225 <chr> "A74a_16", "5", "4", "4", "6", "3"
## $ X226 <chr> "A74a_17", "5", "3", "3", "5", "4"
## $ X227 <chr> "A74a_18", "4", "3", "3", "3", "4"
## $ X228 <chr> "A74a_19", "2", "3", "3", "3", "6"
## $ X229 <chr> "A74a_20", "2", "2", "3", "3", "6"
File gốc
source("dieutra-hogiadinh-hcm.r")
Tả phải chuyển đổi dạng dữ liệu của từng biến
Xem lại dữ liệu xem có sự thay đổi gì không?
glimpse(head(df))
## Rows: 6
## Columns: 229
## $ Q1a <int> 1, 2, 3, 4, 5, 6
## $ Q1b <fct> 34, 34, 369, 377, 371, 33
## $ Q1c <fct> 47, 94, 801, 801, 801, 94
## $ Q1d <fct> 47, 94, 801, 801, 801, 94
## $ Q1e <fct> 29, 29, 367, 367, 367, 29
## $ Q1f1 <fct> 13, 13, 17, 25, 26, 15
## $ Q1f2 <fct> 1, 1, 2, 2, 2, 1
## $ Q1g1 <fct> 10, 10, 15, 24, 25, 14
## $ Q1g2 <fct> 1, 1, 2, 2, 2, 1
## $ Q2 <fct> 2, 2, 2, 2, 2, 2
## $ Q3 <chr> "B<U+1EA1>ch Minh H<U+1EA3>i", "Ðào Ð<U+1EE9>c Hoàng", "nguy<U+1EC5>n van t<U+1ED1>t", "lê minh t~
## $ Q4 <chr> "202", "202", "67", "67", "67", "202"
## $ Q5 <fct> 1, 1, 1, 1, 1, 1
## $ Q6a <fct> 1, 1, 1, 1, 1, 1
## $ Q6b <chr> "1674385916", "837222457", "838597075", "908739072", "93701527~
## $ Q7 <fct> 1, 1, 1, 1, 1, 1
## $ Q8a <fct> 1, 2, 1, 1, 2, 1
## $ Q8b <fct> 2, 3, 3, 2, 2, 3
## $ Q8c <fct> 2, 2, 1, 1, 1, 1
## $ Q8d <fct> 2, 2, 1, 2, 2, 1
## $ Q8e <fct> 3, 3, 1, 1, 1, 1
## $ Q9 <dbl> NA, 2500000, NA, NA, 1800000, NA
## $ Q10 <dbl> 25, 7, 62, 75, 1, 40
## $ Q11 <chr> "202", "298", NA, NA, "73", NA
## $ Q12a <fct> 1, 1, 1, 1, 1, 1
## $ Q12b <fct> 1, 1, 1, 1, 1, 2
## $ Q12c <fct> 2, 2, 2, 2, 1, 2
## $ Q12d <fct> 1, 1, 2, 1, 2, 2
## $ Q12e <fct> 2, 1, 1, 2, 2, 2
## $ Q12f <fct> 2, 1, 1, 2, 1, 2
## $ Q13a <dbl> 3, 4, 3, 4, 4, 2
## $ Q13b <dbl> 0, 0, 0, 0, 0, 0
## $ Q13c <dbl> 0, 0, 0, 0, 0, 0
## $ Q13d <dbl> 0, 0, 0, 0, 0, 0
## $ Q13e <dbl> 0, 0, 0, 0, 0, 0
## $ Q13f <dbl> 0, 0, 1, 0, 0, 0
## $ Q13g <dbl> 0, 0, 0, 0, 0, 0
## $ Q13h <dbl> 0, 0, 0, 0, 0, 0
## $ Q13i <dbl> 0, 0, 0, 0, 0, 0
## $ Q13j <dbl> 0, 0, 0, 0, 0, 0
## $ Q13k <dbl> 3, 4, 3, 4, 4, 2
## $ Q13l <dbl> 3, 3, 3, 4, 4, 2
## $ Q13m <dbl> 0, 0, 0, 0, 0, 1
## $ Q14 <fct> 9, 10, 9, 11, 8, 8
## $ Q15 <dbl> 2, 3, 3, 2, 3, 1
## $ Q16 <fct> 1, 2, 1, 1, 2, 1
## $ Q17 <dbl> 1, 1, 1, 1, 1, 1
## $ Q18a1 <dbl> 6, 6, 6, 6, 6, 6
## $ Q18b1 <dbl> 5, 10, 3, 6, 3, 7
## $ Q18c1 <fct> 1, 1, 1, 1, 1, 1
## $ Q18d1 <fct> 1, 1, 1, 1, 1, 1
## $ Q18a2 <dbl> 1, 6, 6, 6, 6, 6
## $ Q18b2 <dbl> 2, 10, 2, 5, 2, 5
## $ Q18c2 <fct> 1, 1, 1, 1, 1, 1
## $ Q18d2 <fct> 2, 1, 1, 1, 1, 1
## $ Q18a3 <dbl> NA, 8, NA, 6, 6, NA
## $ Q18b3 <dbl> NA, 10, NA, 2, 2, NA
## $ Q18c3 <fct> NA, 1, NA, 1, 1, NA
## $ Q18d3 <fct> NA, 1, NA, 1, 1, NA
## $ Q18a4 <dbl> NA, NA, NA, NA, 1, NA
## $ Q18b4 <dbl> NA, NA, NA, NA, 1, NA
## $ Q18c4 <fct> NA, NA, NA, NA, 1, NA
## $ Q18d4 <fct> NA, NA, NA, NA, 2, NA
## $ Q18a5 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b5 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c5 <fct> NA, NA, NA, NA, NA, NA
## $ Q18d5 <fct> NA, NA, NA, NA, NA, NA
## $ Q18a6 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b6 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c6 <fct> NA, NA, NA, NA, NA, NA
## $ Q18d6 <fct> NA, NA, NA, NA, NA, NA
## $ Q18a7 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b7 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c7 <fct> NA, NA, NA, NA, NA, NA
## $ Q18d7 <fct> NA, NA, NA, NA, NA, NA
## $ Q18a8 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b8 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c8 <fct> NA, NA, NA, NA, NA, NA
## $ Q18d8 <fct> NA, NA, NA, NA, NA, NA
## $ Q18a9 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b9 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c9 <fct> NA, NA, NA, NA, NA, NA
## $ Q18d9 <fct> NA, NA, NA, NA, NA, NA
## $ Q18a10 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18b10 <dbl> NA, NA, NA, NA, NA, NA
## $ Q18c10 <fct> NA, NA, NA, NA, NA, NA
## $ Q18d10 <fct> NA, NA, NA, NA, NA, NA
## $ Q19 <dbl> 300000, 1000000, 900000, 1800000, 1200000, 1000000
## $ Q43 <fct> 5, 2, 5, 5, 1, 5
## $ Q44a <fct> 2, 2, 1, 1, 2, 1
## $ Q44b <chr> "202", "298", NA, NA, "73", NA
## $ Q45 <fct> 1, 1, 1, 6, 5, 2
## $ Q46 <fct> 5, 2, 5, 3, 5, 1
## $ Q53 <fct> 2, 1, 2, 2, 1, 1
## $ Q54 <fct> 2, 2, 2, 2, 2, 2
## $ Q55 <fct> NA, 1, NA, NA, 2, 2
## $ Q56 <fct> NA, 3, NA, NA, 3, 3
## $ Q57 <fct> NA, 3, NA, NA, 2, 3
## $ Q58 <fct> NA, 3, NA, NA, 2, 3
## $ Q59 <fct> NA, 2, NA, NA, 2, 3
## $ Q60 <fct> NA, 1, NA, NA, 1, 1
## $ Q61 <fct> 1, 3, 2, 2, 2, 2
## $ Q62a1 <fct> 3, 2, 3, 3, 3, 3
## $ Q62a2 <fct> 2, 2, 2, 2, 2, 3
## $ Q62a3 <fct> 3, 3, 3, 3, 2, 2
## $ Q62a4 <fct> 2, 1, 2, 2, 3, 2
## $ Q62a5 <fct> 1, 2, 2, 2, 2, 2
## $ Q62b1 <fct> 2, 1, 2, 2, 2, 1
## $ Q62b2 <fct> 2, 1, 3, 1, 1, 2
## $ Q62b3 <fct> 2, 2, 2, 1, 2, 2
## $ Q62b4 <fct> 2, 2, 2, 2, 1, 1
## $ Q62b5 <fct> 2, 2, 3, 2, 1, 1
## $ Q62c <fct> 3, 1, 4, 3, 3, 1
## $ Q63a1 <fct> 3, 3, 1, 2, 3, 3
## $ Q63b1 <fct> 2, 3, 1, 3, 2, 3
## $ Q63c1 <fct> 2, 2, 2, 3, 3, 3
## $ Q63a2 <fct> 2, 2, 2, 3, 3, 3
## $ Q63b2 <fct> 2, 3, 2, 2, 3, 3
## $ Q63c2 <fct> 2, 3, 2, 3, 2, 3
## $ Q63a3 <fct> 3, 3, 1, 1, 2, 3
## $ Q63b3 <fct> 2, 3, 2, 2, 1, 3
## $ Q63c3 <fct> 2, 3, 2, 2, 2, 3
## $ Q63a4 <fct> 3, 3, 1, 2, 2, 2
## $ Q63b4 <fct> 2, 3, 2, 1, 2, 2
## $ Q63c4 <fct> 2, 3, 2, 2, 1, 3
## $ Q64 <fct> 5, 3, 4, 4, 4, 3
## $ Q65 <fct> 3, NA, NA, NA, NA, NA
## $ Q66_1 <fct> 3, 3, 3, 4, 5, 3
## $ Q66_2 <fct> 2, 3, 3, 4, 4, 3
## $ Q66_3 <fct> 2, 4, 6, 4, 3, 3
## $ Q66_4 <fct> 2, 2, 6, 2, 3, 3
## $ Q66_5 <fct> 3, 3, 2, 2, 4, 3
## $ Q66_6 <fct> 3, 3, 6, 2, 5, 4
## $ Q66_7 <fct> 2, 2, 2, 2, 5, 3
## $ Q66_8 <fct> 3, 2, 6, 3, 5, 3
## $ Q66_9 <fct> 3, 3, 2, 3, 2, 3
## $ Q66_10 <fct> 3, 3, 3, 5, 2, 3
## $ Q66_11 <fct> 3, 4, 3, 6, 3, 2
## $ Q66_12 <fct> 4, 4, 6, 6, 3, 4
## $ Q66_13 <fct> 2, 2, 6, 6, 3, 2
## $ Q66a <fct> 1, 13, 1, 1, 4, 1
## $ Q66b <fct> 2, 8, 2, 4, 7, 6
## $ Q66c <fct> 4, 4, 7, 6, 9, 13
## $ Q67a_1 <fct> 2, 1, 1, 1, 2, 1
## $ Q67a_2 <fct> 6, 3, 2, 8, 8, 4
## $ Q67a_3 <fct> 5, 7, 6, 5, 4, 5
## $ Q67b_1 <fct> 4, 4, 4, 7, 6, 3
## $ Q67b_2 <fct> 1, 5, 5, 6, 1, 6
## $ Q67b_3 <fct> 7, 6, 7, 3, 7, 7
## $ Q67c_1 <fct> 4, 7, 4, 4, 7, 4
## $ Q67c_2 <fct> 8, 2, 5, 5, 3, 2
## $ Q67c_3 <fct> 6, 5, 7, 2, 2, 8
## $ Q68a_1 <fct> 1, 3, 11, 2, 1, 3
## $ Q68a_2 <fct> 3, 2, 12, 10, 9, 2
## $ Q68a_3 <fct> 5, 5, 8, 5, 5, 1
## $ Q68a_4 <fct> 6, 1, 5, 1, 10, 5
## $ Q68a_5 <fct> 11, 10, 16, 8, 11, 4
## $ Q68b_1 <fct> 13, 7, 7, 13, 8, 7
## $ Q68b_2 <fct> 14, 8, 9, 4, 2, 8
## $ Q68b_3 <fct> 15, 9, 4, 9, 12, 9
## $ Q68b_4 <fct> 16, 16, 13, 7, 3, 10
## $ Q68b_5 <fct> 4, 12, 14, 3, 7, 16
## $ Q68c_1 <fct> 8, 5, 7, 16, 4, 5
## $ Q68c_2 <fct> 9, 9, 13, 6, 13, 13
## $ Q68c_3 <fct> 7, 13, 14, 12, 6, 15
## $ Q68c_4 <fct> 13, 6, 4, 15, 14, 14
## $ Q68c_5 <fct> 16, 15, 3, 8, 7, 11
## $ Q69a_1 <fct> 3, 4, 3, 5, 5, 4
## $ Q69a_2 <fct> 2, 2, 3, 3, 4, 3
## $ Q69a_3 <fct> 2, 2, 2, 3, 3, 3
## $ Q69a_4 <fct> 4, 3, 3, 2, 3, 3
## $ Q69a_5 <fct> 3, 3, 4, 3, 3, 2
## $ Q69a_6 <fct> 2, 4, 3, 6, 5, 2
## $ Q69a_7 <fct> 2, 4, 3, 5, 5, 3
## $ Q69a_8 <fct> 1, 1, 4, 5, 5, 3
## $ Q69a_9 <fct> 1, 1, 2, 5, 4, 3
## $ Q69a_10 <fct> 2, 1, 3, 4, 4, 3
## $ Q69b_1 <fct> 3, 8, 2, 2, 3, 9
## $ Q69b_2 <fct> 8, 9, 8, 6, 5, 8
## $ Q69b_3 <fct> 9, 3, 10, 8, 8, 2
## $ Q70 <fct> 2, 2, 2, 1, 1, 2
## $ Q71a_1 <fct> 1, 1, 1, 1, 1, 1
## $ Q71a_2 <fct> 1, 1, 1, 1, 2, 1
## $ Q71a_3 <fct> 2, 2, 1, 1, 2, 1
## $ Q71a_4 <fct> 1, 2, 2, 2, 2, 1
## $ Q71a_5 <fct> 1, 2, 1, 2, 1, 3
## $ Q71a_6 <fct> 1, 1, 1, 2, 1, 3
## $ Q71a_7 <fct> 1, 1, 2, 3, 2, 2
## $ Q71a_8 <fct> 1, 1, 1, 3, 1, 1
## $ Q71a_9 <fct> 1, 1, 1, 3, 3, 1
## $ Q71a_10 <fct> 1, 3, 1, 2, 1, 2
## $ Q71a_11 <fct> 1, 3, 1, 2, 1, 2
## $ Q71a_12 <fct> 1, 3, 2, 2, 3, 2
## $ Q71a_13 <fct> 2, 3, 2, 1, 2, 1
## $ Q71a_14 <fct> 1, 1, 2, 1, 1, 1
## $ Q71a_15 <fct> 1, 1, 1, 1, 1, 1
## $ Q71a_16 <fct> 1, 1, 2, 2, 2, 1
## $ Q71a_17 <fct> 1, 1, 1, 2, 3, 1
## $ Q71a_18 <fct> 1, 2, 1, 2, 3, 1
## $ Q71b_1 <fct> 2, 8, 1, 1, 3, 14
## $ Q71b_2 <fct> 15, 7, 6, 2, 8, 15
## $ Q72 <fct> 1, 1, 1, 2, 2, 2
## $ Q73a <fct> 2, 3, 1, 6, 6, 4
## $ Q73b <fct> 3, 4, 2, 5, 5, 3
## $ Q73c <fct> 1, 1, 5, 7, 2, 1
## $ Q73d <fct> 6, 2, 3, 2, 1, 2
## $ Q73e <fct> 4, 7, 4, 1, 7, 6
## $ Q73f <fct> 5, 6, 6, 3, 3, 7
## $ Q73g <fct> 7, 5, 7, 4, 4, 5
## $ A74a_1 <fct> 4, 5, 3, 5, 5, 4
## $ A74a_2 <fct> 5, 5, 3, 6, 5, 4
## $ A74a_3 <fct> 5, 5, 4, 3, 3, 3
## $ A74a_4 <fct> 5, 5, 3, 2, 3, 3
## $ A74a_5 <fct> 5, 5, 2, 2, 4, 3
## $ A74a_6 <fct> 5, 5, 3, 4, 5, 4
## $ A74a_7 <fct> 5, 5, 3, 5, 4, 4
## $ A74a_8 <fct> 5, 5, 4, 4, 3, 4
## $ A74a_9 <fct> 5, 5, 4, 4, 5, 4
## $ A74a_10 <fct> 5, 5, 3, 4, 5, 4
## $ A74a_11 <fct> 5, 5, 3, 3, 3, 3
## $ A74a_12 <fct> 5, 5, 2, 3, 3, 4
## $ A74a_13 <fct> 5, 5, 3, 3, 4, 3
## $ A74a_14 <fct> 3, 4, 3, 4, 6, 4
## $ A74a_15 <fct> 3, 4, 3, 4, 4, 4
## $ A74a_16 <fct> 5, 4, 4, 6, 3, 3
## $ A74a_17 <fct> 5, 3, 3, 5, 4, 3
## $ A74a_18 <fct> 4, 3, 3, 3, 4, 3
## $ A74a_19 <fct> 2, 3, 3, 3, 6, 4
## $ A74a_20 <fct> 2, 2, 3, 3, 6, 4
df01 <- df%>%
select(Q3,Q4,Q7,Q8a,Q8b,Q8c,Q8d,Q8e,Q9,Q10,Q11)
head(df01)
## Q3 Q4 Q7 Q8a Q8b Q8c Q8d Q8e Q9
## 1 B<U+1EA1>ch Minh H<U+1EA3>i 202 1 1 2 2 2 3 NA
## 2 Ðào Ð<U+1EE9>c Hoàng 202 1 2 3 2 2 3 2500000
## 3 nguy<U+1EC5>n van t<U+1ED1>t 67 1 1 3 1 1 1 NA
## 4 lê minh tru<U+1EDD>ng 67 1 1 2 1 2 1 NA
## 5 nguy<U+1EC5>n th<U+1ECB> thu th<U+1EA3>o 67 1 2 2 1 2 1 1800000
## 6 Nguy<U+1EC5>n Tr<U+1ECD>ng Tu<U+1EA5>n 202 1 1 3 1 1 1 NA
## Q10 Q11
## 1 25 202
## 2 7 298
## 3 62 <NA>
## 4 75 <NA>
## 5 1 73
## 6 40 <NA>
summary(df01)
## Q3 Q4 Q7 Q8a Q8b Q8c
## Length:20000 Length:20000 1:18647 1:17154 1:1614 1:17519
## Class :character Class :character 2: 1353 2: 2779 2:9894 2: 2444
## Mode :character Mode :character 3: 41 3:6720 3: 37
## 4: 26 4:1772
##
##
##
## Q8d Q8e Q9 Q10 Q11
## 1:13249 1:13937 Min. : 0 Min. : 0.00 Length:20000
## 2: 6679 2: 510 1st Qu.: 0 1st Qu.:10.00 Class :character
## 3: 72 3: 5553 Median : 1300000 Median :36.00 Mode :character
## Mean : 1722172 Mean :33.03
## 3rd Qu.: 2500000 3rd Qu.:50.00
## Max. :65000000 Max. :98.00
## NA's :16140 NA's :45
table(df01$Q8a) # Cách tính thứ 1 sử dụng trực tiếp hàm table trong R
##
## 1 2 3 4
## 17154 2779 41 26
df01 %>%
count("Q8a") # cách tính thứ 2 sử dụng dplyr với count
## Q8a freq
## 1 1 17154
## 2 2 2779
## 3 3 41
## 4 4 26
count(df01, "Q8a")
## Q8a freq
## 1 1 17154
## 2 2 2779
## 3 3 41
## 4 4 26
Vẽ đồ thị thanh
ggplot(df01 %>%
count("Q8a"), aes(x=Q8a, y=freq))+
geom_bar(stat="identity")
Trang điểm thêm cho đồ thị
df01 %>%
count("Q8a") %>%
ggplot(aes(x=Q8a, y=freq))+ #khai bao trục hoành x và trục tung
geom_bar(stat="identity", fill="red", alpha =0.5) + # khai báo biểu đồ dạng barchart, loại biểu đồ frequenty, tô đỏ và làm mờ vùng tô đỏ
labs(title ="Trình trạng nhà ở", # khai báo tên của biểu đồ
subtitle = "Chủ sở hữu", # khai báo tên phụ của biểu đồ
x = "Loại chủ sở hữu", # khai báo tên trục hoành
y = "Số lượng") # khai báo tên trục tung
df01 %>%
count("Q8a") %>%
ggplot(aes(x=as.factor(Q8a), y=freq))+ # cách vẽ thứ 2 trong đó biến các giá trị 1, 2, 3, 4 thành dạng factor (category) thay vì là số, vì bản chất giá trị này không phải là số.
geom_bar(stat="identity", fill="red", alpha =0.5) +
labs(title ="Trình trạng nhà ở",
subtitle = "Chủ sở hữu",
x = "Loại chủ sở hữu",
y = "Số lượng")+
scale_x_discrete(labels = xticks) + # điền tên các giá trị tương ứng ở trục hoành
geom_text(aes(label=freq), position=position_dodge(width=0.9), vjust=-0.25, color ="blue") # thêm trên đầu mỗi thanh các giá trị tương ứng với nhóm
tyle <- 1000000
df01%>%
filter(!is.na(Q9), Q9 != 0, Q9 <10000000)%>%
select(Q9)%>%
ggplot(aes(x=Q9/tyle))+
geom_density()+
geom_histogram(aes(y = ..density..),colour = 1, fill = "white", alpha=0.2)
Vẽ đồ thị động
tyle <- 1000000
p<-df01%>%
filter(!is.na(Q9), Q9 != 0, Q9 <10000000)%>%
select(Q9)%>%
ggplot(aes(x=Q9/tyle))+
geom_density()+
geom_histogram(aes(y = ..density..),colour = 1, fill = "white", alpha=0.2)
library(plotly)
ggplotly(p)